home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1997 December / Internet_Info_CD-ROM_Walnut_Creek_December_1997.iso / ietf / urn / urn-archives / urn-ietf.archive.9703 / 000024_owner-urn-ietf _Wed Mar 12 11:40:19 1997.msg < prev    next >
Internet Message Format  |  1997-04-01  |  10KB

  1. Received: (from daemon@localhost)
  2.     by services.bunyip.com (8.8.5/8.8.5) id LAA01583
  3.     for urn-ietf-out; Wed, 12 Mar 1997 11:40:19 -0500 (EST)
  4. Received: from mocha.bunyip.com (mocha.Bunyip.Com [192.197.208.1])
  5.     by services.bunyip.com (8.8.5/8.8.5) with SMTP id LAA01577
  6.     for <urn-ietf@services.bunyip.com>; Wed, 12 Mar 1997 11:40:14 -0500 (EST)
  7. Received: from sdgmail.ncsa.uiuc.edu by mocha.bunyip.com with SMTP (5.65a/IDA-1.4.2b/CC-Guru-2b)
  8.         id AA22381  (mail destined for urn-ietf@services.bunyip.com); Wed, 12 Mar 97 11:40:09 -0500
  9. Received: from void.ncsa.uiuc.edu (void [141.142.103.20]) by ncsa.uiuc.edu (8.8.5/8.8.5) with ESMTP id KAA23966; Wed, 12 Mar 1997 10:40:00 -0600 (CST)
  10. From: Daniel LaLiberte <liberte@ncsa.uiuc.edu>
  11. Received: (from liberte@localhost) by void.ncsa.uiuc.edu (8.8.2/8.8.2) id KAA08753; Wed, 12 Mar 1997 10:39:36 -0600 (CST)
  12. Date: Wed, 12 Mar 1997 10:39:36 -0600 (CST)
  13. Message-Id: <199703121639.KAA08753@void.ncsa.uiuc.edu>
  14. To: "Karen R. Sollins" <sollins@LCS.MIT.EDU>
  15. Cc: urn-ietf@bunyip.com
  16. Subject: Re: [URN] semantic representation in URNs
  17. In-Reply-To: <v03010d02af4be31443f1@[18.26.0.235]>
  18. References: <199703102035.PAA27993@lysithea.lcs.mit.edu>
  19.     <199703112235.RAA28800@lysithea.lcs.mit.edu>
  20.     <v03010d02af4be31443f1@[18.26.0.235]>
  21. Sender: owner-urn-ietf@Bunyip.Com
  22. Precedence: bulk
  23. Reply-To: Daniel LaLiberte <liberte@ncsa.uiuc.edu>
  24. Errors-To: "owner-urn-ietf@bunyip.com
  25.  > At 4":01.PM.-0600.3/10/97,
  26.         Daniel LaLiberte wrote:
  27.  
  28. Karen R. Sollins writes:
  29.  > Location is one form of semantic information; think of it as one dimension
  30.  > in semantic space.
  31.  
  32. Since the subject of this thread is semantics in URNs, and the broader
  33. question is not just human friendly semantics but any kind of
  34. semantics, we should probably try to stay at a level above the details
  35. of particular semantic dimensions.  Each dimension could lead us off
  36. in another direction.
  37.  
  38. For example, the issue of location semantics is a big one and is
  39. exactly the same question as URNs vs URLs and whether they are
  40. distinguishable.  Attempting to stay clear of that debate, it would
  41. help if you could simply and precisely define location.  I.e. what are
  42. (is?) the semantics of locations?  (Dan Connelly claims that there is
  43. not a definition of location-independence in any RFC (or draft?))  My
  44. claim is that any adequate definition of location would include URNs
  45. themselves if URNs can be looked up in a globally consistent manner.
  46. I'll respond to your definition in private mail.
  47.  
  48. So the general question, applied to other kinds of semantics, is: how
  49. do you really know when you are building in some kind of semantics?
  50. There is explicit semantics and implicit semantics.
  51.  
  52. But there are some other distinctions that should be considered in the
  53. kinds of semantics.  There is semantics regarding the identifier
  54. itself and semantics regarding the resource(s) associated with the
  55. identifier.  For some kinds of semantics, it is difficult to
  56. distinguish whether you have one or the other.  You give examples of
  57. semantics of the resource:
  58.  
  59.  > Another might be programming language in which
  60.  > something is implemented or natural language in which it is expressed.
  61.  > Consider that another dimension. Another might be some indication of
  62.  > underlying algorithm on which the resource is based.  Again, another
  63.  > dimension.
  64.  
  65. But here are some semantics of the identifier itself.  The scheme name
  66. (e.g. "urn:"), naming authority (single or hierarchy), structure of
  67. the identifier itself are very low level semantics (i.e. on the
  68. syntax-semantics continuum) about how to interpret the identifier
  69. itself.  One step up from this, there might be a field that indicates
  70. how to interpret the remainder of the identifier.  Others: there might
  71. be a date field that indicates when the identifier itself was created,
  72. not the resource it refers to.  There might be a checksum or signature
  73. field that can be used to verify the identifier itself, not the
  74. resource it refers to.
  75.  
  76. One place where the boundary between semantics of the identifier and
  77. semantics of the resource gets blurry is in the organization of the
  78. name space.  In a hierarchical name space with a hierarchical name,
  79. the components of the name presummably (but not necessarily) map on to
  80. the organization of the space.  This blurs the distinction because in
  81. the process of resolving the identifier over several resolution steps,
  82. you are getting closer to the resource itself.  As the organization of
  83. the space changes, the concern is that the resolution process could
  84. break.  I discussed strategies and mechanisms for dealing with that
  85. reorganization in previous mail.
  86.  
  87. The key question regarding semantics is whether the semantics of the
  88. organization of the name space is a reflection of the semantics of the
  89. resources.  Yes and no.  Each node in the hierarchy (if it is a
  90. hierarchy) can be considered to represent a collection, a resource
  91. itself.  It may correspond to a resolution service that can provide
  92. information about that collection resource.  But, importantly, these
  93. collections need have no necessary semantic relevance in that the
  94. resources in a collection need not be at all related to each other
  95. other than being in the same collection.  Whether it is useful to have
  96. no meaningful relationship between collection members is another
  97. question.
  98.  
  99. What I think should happen is that these collections are meaningful,
  100. but their meaning is not intended to be complete or persistent.  In
  101. other words, the collection of /edu/uiuc/ncsa/liberte is generally my
  102. stuff, but some of my stuff might also appear elsewhere
  103. (e.g. /com/bunyip/ietf/urn/liberte) and I might provide access to
  104. other people's stuff via my space (e.g. ../liberte/hotlist/urns).
  105.  
  106. Then we get down to semantics that is more clearly about the resource
  107. itself, but notice that we are getting into the metadata question.
  108. (I.e. What is the difference between data and metadata?)  Bunches of
  109. metadata could be included in identifiers (e.g. title, author, date,
  110. subject, etc), and some people consider this to be the true way to
  111. name resources.  For small resources, the resource *itself* could be
  112. in the identifier (e.g. Larry's "data" URI).
  113.  
  114. My argument is that there will always be semantics in identifiers
  115. unless the identifiers are useless for anything except for being
  116. meaningless identifiers.  The nature of semantics is an association
  117. between things, so, for example, you can get from an identifier to
  118. the associated resource.
  119.  
  120. [Philosophical tangent: The general principal I am applying is that
  121. there are really continuums everywhere.  Wherever we draw lines, we
  122. distinguish things that are not really distinguishable.  It seems
  123. useful to draw lines anyway, but the Universe conspires to ultimately
  124. erase them, or scribble over them.]
  125.  
  126.  > Of course the number of possibilities is unlimited.  Yes,
  127.  > n-dimensional space.  If URNs can be assumed to contain semantic
  128.  > information, services will be built on that assumption, taking advantage of
  129.  > the embedded knowledge.
  130.  
  131. Given the argument (conclusion?) that there will always be semantics
  132. in identifiers, the question is how much and what kind of semantics.
  133. It is a trade off.  Generally, the more semantics a service takes
  134. advantage of, the more it needs to be flexible when those semantics
  135. may change.  Location semantics is a relatively simple case that
  136. requires an indirection or sequence of indirections to eventually find
  137. the resource at some location.
  138.  
  139.  > If that knowledge can become invalid just as
  140.  > location information can become invalid, we have an n-dimensional problem
  141.  > where in URLs we have a one-dimensional problem.
  142.  
  143. URLs can have just as many dimensions of semantics as URNs.
  144.  
  145.  > Seems undesirable to me,
  146.  > but the question is whether we should actively discourage our "customers"
  147.  > from shooting themselves in the foot in this particular way or not.
  148.  
  149. We should discourage people from building services that don't work in
  150. the face of changing semantics.  Putting it that way let's people
  151. decide for themselves whether and how they can deal with changing
  152. semantics.
  153.  
  154.  > What I was trying to say is that if the hierarchy reflects delegation then
  155.  > using it to reflect something else as well (say, for example, derivation)
  156.  > is extremely difficult because it is overloading the meaning of
  157.  > hierarchical components.  Doing this in general probably becomes impossible.
  158.  
  159. I would tend to agree that overloading hierarchical components with
  160. other semantics could cause problems, but there are other places that
  161. additional semantics could be included in an identifier.  For example,
  162. semantics could be included before or after the hierarchial part
  163. (e.g. the //higher-level-space/lower/level/space and
  164. ...;name=value;name=value extensions), or each component could have
  165. its own additional semantics that applies only to itself, or maybe to
  166. the remainder of the path.
  167.  
  168.  > Saltzer, J., Reed, D., and Clark, D.D., "End-to-End Arguments in System
  169.  > Design", ACM Transactions on Computer Systems, Vol. 2, No. 4, November
  170.  > 1984, pp. 277-288.
  171.  > 
  172.  > This paper makes the argument that repeating functionality at different
  173.  > layers of abstraction (particularly as exemplified in security mechanisms)
  174.  > is a bad idea. It probably should be required reading for all systems and
  175.  > protocol designers and implementers.  I strongly recommend it.
  176.  
  177. Looks very worthwhile.  1984 is BW (before web), so finding it on-line
  178. might be difficult.  I'll have to take a trip to the library; could
  179. be educational. :-)
  180.  
  181.  > ... And we say that semantics can be included in whatever language
  182.  > the creator of the URN chooses, and if the semantics cannot be understood
  183.  > and useful in other contexts, tough luck.
  184.  
  185. That's my conclusion too.
  186.  
  187. dan